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HE: [目的 /意义 ] 通过 界定 科学 数据 安全 行为 的 概念 ， 分 析 科 研 活动 不 同 阶段 应 如 何 保证 科学 


数据 安全 ， 对 规范 科研 人 员 的 科学 数据 安全 行为 、 促 进 科学 数据 安全 管理 、 制 定 科学 数据 安全 政策 、 完 
善 科学 数据 安全 管理 体系 具有 重要 意义 。[ 方 法 /过 程 ] 采用 网 络 调研 法 ， 整 合 信息 安全 行为 和 科学 数 
据 安 全 管理 的 定义 ， 提 出 科学 数据 安全 行为 的 概念 。 在 此 基础 上 ， 从 理论 出 发 ， 结 合 科学 数据 管理 与 共 
享 的 实践 经 验 ， 系 统 阐述 如 何 通过 个 人 行为 保障 科学 数据 安全 。 [ 结果 / 结论 ] 现 阶段 科学 数据 安全 管 
理 主 要 针对 科学 数据 管理 平台 ， 从 行为 学 视角 探讨 科学 数据 安全 的 研究 尚 处 于 起 步 阶段 。 本 文 基于 科研 
过 程 ， 从 两 方面 对 如 何 规范 科研 人 员 的 行为 以 提升 科学 数据 安全 进行 分 析 : 其 一 ， 对 存在 科学 数据 安全 
风险 的 阶段 ， 结 合 科学 数据 管理 的 政策 对 此 提出 针对 性 的 改进 策略 ; 其 二 ， 对 不 存在 明显 安全 风险 的 阶 
段 ， 根 据 国内 外 科学 数据 管理 的 实践 经 验 ， 提 出 建议 。 
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科学 数据 是 科研 观测 、 科 学 研究 活动 的 成 
果 ， 是 科技 创新 和 国家 发 展 的 重要 资源 "…。 鉴 
于 科学 数据 共享 对 科技 创新 能 力 、 科 技 整体 水 
平 以 及 社会 经 济 发 展 有 促进 作用 ,全球 范围 
内 掀起 了 科学 数据 开放 获取 的 热潮 ， 不 少 国际 
组 织 、 国 家 、 机 构建 立 起 了 数据 管理 中 心 ， 如 
世界 数据 中 心 汪 、 澳 大 利 亚 国家 数据 服务 中 心 
局 、 英 国 数字 管理 中 心中 以 及 以 国外 高 校 图 书 
馆 ( 如 爱丁堡 大 学 图 书馆 中”、 普 林 斯 顿 大 学 图 


PASE) 为 首 建立 的 数据 管理 中 心 。 科 学 数 
据 开 放 共 享 在 促进 科学 技术 快速 发 展 的 同时 , 也 
造成 了 “数据 获取 ”和 “数据 安全 及 隐私 保 
护 ” 之 间 的 不 平衡 ， 以 致 出 现 了 一 系列 的 科学 
数据 安全 问题 。 科 学 数据 安全 不 仅 关 平 个 人 
信息 安全 ， 同 时 还 关 平 国家 安全 外 。 为 了 保护 
科学 数据 安全 ， 各 国 从 宏观 层面 制定 了 相关 政 
策 ， 比 如 英国 1998 年 颁布 的 数据 保护 法 案 (Data 
Protection Act)", KHERA (EC ) 发 布 的 《EC 
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对 访问 与 保存 科学 信息 的 建议 》 趾 ， 美 国 颁布 的 
《健康 保险 携带 和 责任 法 案 》 (Health Insurance 
Portability and Accountability Act, HIPAA ) "”, 
在 微观 层面 ， 相 关 科 研 项 目 基 金 会 要 求 他 们 所 
资助 的 研究 者 提交 可 以 为 科研 成 果 提供 佐证 的 
科研 数据 ， 同 时 对 数据 的 存储 和 保存 以 及 科学 
数据 的 处 理 方式 都 做 了 相应 规定 "1。 

根据 2018 全 球 信息 安全 调查 显示 ， 绝 大 多 
数 安 全 事故 均 是 由 人 的 不 安全 行为 引发 的 "1。 
联合 信息 系统 委员 会 ( Joint Information Systems 
Committee ) 指出 潜在 的 科学 数据 安全 风险 通常 
不 是 由 所 采取 的 技术 造成 的 ， 而 是 由 于 研究 人 
员 不 恰当 的 行为 导致 中。 例如 ，2018 年 引起 全 
球 关注 的 Facebook 数据 泄露 事件 ， 其 缘由 是 剑 
桥 大 学 心理 测量 中 心 教授 将 从 Facebook 收集 的 
用 于 性 格 分 析 的 用 户 数据 泄露 给 了 剑桥 分 析 公 
aA, 目前， 对 科学 数据 安全 的 探讨 主要 集中 
在 政策 和 技术 层面 ， 而 科研 人 员 对 政策 的 遵循 
和 技术 的 采纳 程度 还 受到 个 人 主观 意愿 的 影响 。 
所 以 学 者 开始 关注 从 行为 学 的 视角 ， 探 究 如 何 
让 科研 人 员 能 主动 、 有 意识 地 保护 科学 数据 安 
全 。 

鉴于 此 ， 为 了 规范 科研 人 员 的 科学 数据 安 
全 管理 方式 ， 让 科学 数据 更 好 地 为 国家 科技 创 
新 、 经 济 社会 发 展 和 国家 安全 提供 支撑 ""， 笔 
者 从 现实 需求 出 发 ， 提 出 科学 数据 安全 行为 这 
一 概念 。 在 科研 过 程 中 ， 科 学 数据 安全 主要 受 
到 科研 人 员 行 为 的 影响 。 在 科学 数据 生命 周期 
中 ， 科 研 人 员 同 时 扮演 着 数据 的 生产 者 、 使 用 
者 、 管 理 者 和 监管 者 等 多 重 角色 ""。 科 研 人 员 
的 多 重 身份 与 科学 数据 形式 的 动态 变化 特征 为 
科学 数据 安全 管理 增加 了 难度 ， 规 范 科 研 人 员 
的 行为 有 利于 实现 科学 数据 的 有 效 管 理 。 所 以 
笔者 基于 科研 过 程 阐述 不 同 阶段 存在 哪些 科学 
数据 安全 风险 ， 以 及 应 该 从 哪些 方面 可 以 规范 
科研 人 员 的 科学 数据 安全 行为 ， 进 一 步 丰 富 科 
学 数据 安全 管理 的 研究 内 容 ， 促 进 科 学 数据 管 
理 与 共享 的 发 展 ， 并 为 科学 数据 安全 管理 提供 
指导 和 建议 ， 为 科学 数据 管理 的 政策 制定 商定 
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理论 基础 。 
@O 科 学 数据 安全 行为 概念 的 界定 

科学 数据 安全 行为 是 本 文 的 研究 对 象 ， 从 
已 有 的 研究 成 果 来 看 ， 科 学 数据 安全 行为 方面 
的 研究 还 相对 较 少 ， 针 对 科学 数据 安全 行为 的 
概念 界定 尚未 形成 统一 的 认识 。 从 科学 数据 安 
全 行为 产生 、 发 展 的 脉络 看 ， 科 学 数据 安全 行 
为 主要 涉及 信息 安全 行为 和 科学 数据 安全 管理 
两 个 主题 领域 。 就 科学 数据 安全 行为 的 体系 构 
成 而 言 ， 科 学 数据 安全 行为 是 信息 安全 行为 与 
科学 数据 安全 管理 二 者 的 组 合体 ， 同 时 隶属 于 
信息 安全 行为 与 科学 数据 安全 管理 的 研究 范畴 。 
从 科学 数据 安全 行为 的 理论 渊源 看 ， 科 学 数据 
安全 行为 的 概念 是 由 信息 安全 行为 和 科学 数据 
安全 管理 两 个 概念 有 机 整合 而 引申 出 来 的 一 个 
复合 型 概念 。 因 此 ， 明 晰 信息 安全 行为 与 科学 
数据 安全 管理 两 个 基本 概念 是 提出 科学 数据 安 
全 行为 的 基础 和 前 提 。 
1.1 信息 安全 行为 的 定义 

有 关 人 为 因素 对 计算 机 运行 可 靠 性 的 影响 
的 相关 研究 可 以 追溯 到 20 世纪 50 4R", H 
到 20 世纪 90 年 代 系 统 科学 的 兴起 ， 对 信息 安 
全 行为 的 研究 才 开始 引起 学 者 的 广泛 关注 所 。 
以 C. Wood 等 为 代表 的 学 者 最 早 指出 人 为 因素 
对 信息 系统 安全 具有 潜在 影响 中。90 年 代 中 后 
期 ， 互 联网 技术 的 快速 发 展 ， 使 得 维系 信息 系 
统 运 转 的 软件 、 硬 件 变 得 更 加 复杂 ， 学 者 开始 
致力 于 探讨 如 何 充分 利用 技术 的 有 用 性 减少 人 
为 差错 带 来 的 安全 风险 外。21 世纪 初 ， 随 着 信 
息 系统 在 各 个 领域 的 应 用 ， 研 究 发 现 技术 的 应 
用 并 不 能 完全 保证 信息 的 安全 卢 ， 人 为 因素 是 
导致 信息 安全 问题 的 最 根本 的 因素 中， 对 信息 
安全 的 研究 重心 开始 向 个 体 行为 转移 。 从 国内 
外 的 研究 成 果 看 ， 信 息 安全 行为 的 研究 已 经 形 
成 了 相对 完善 的 研究 体系 。 关 于 信息 安全 的 定 
义 有 如 下 解释 : J.M. Stanton 等 从 个 人 行为 角 
度 出 发 认为 信息 安全 行为 是 指 维护 信息 系统 有 
效 性 、 机 密 性 和 完整 性 的 人 的 行为 集合 I; S. 


02310. 


2 


chinaXiv:2 


知识 管理 论坛 


2019 年 第 4 期 (总 第 22 期 ) 


< 局 一 


www.kmf.ac.cn 


Dzazali 等 从 组 织 角 度 出 发 认为 信息 安全 行为 是 
企业 员工 为 避免 组 织 财产 遭遇 损失 及 机 密 信息 
被 曝光 的 行为 中 ; H. Liang 等 认为 信息 威胁 规 
避 行 为 ， 是 指 当 用 户 感知 到 信息 存在 安全 威胁 
时 采取 有 效 的 防护 措施 的 行为 下; J. Wirtz 等 提 
出 网 络 隐 私 保 护 行为 ， 指 的 是 用 户 通过 技术 手 
段 ， 确 定 网 络 安全 性 来 保护 自己 的 信息 及 隐私 
免 受 侵犯 的 行为 所。 可 以 看 出 ， 信 息 安全 行为 
主要 从 行为 学 的 视角 出 发 ， 探 讨 如 何 调动 个 体 
的 主观 能 动 性 ， 以 消除 信息 安全 威胁 、 保 障 信 
息 安全 为 目的 ， 而 采取 的 相关 有 效 措施 的 行为 
AS 
1.2 科学 数据 安全 管理 的 含义 

随 着 数据 密集 型 科学 研究 范式 的 兴起 ， 数 
据 逐 渐 成 为 科学 研究 的 核心 。 其 共享 和 再 利 
用 被 认为 是 科技 创新 和 知识 发 现 的 重要 驱动 因 
素 之 一 。 随 着 国内 外 科学 共享 工程 的 开展 ， 如 
何 有 效 地 对 科学 数据 进行 管理 和 完善 ， 成 为 高 
校 及 科研 机 构 迫 切 关心 的 问题 外。 科学 数据 的 
综合 管理 是 一 个 有 机 的 复杂 系统 ， 包 括 技术 基 
础 设施 的 建设 、 社 会 基础 设施 的 建立 、 政 策 框 
架 、 商 务 计 划 、 人 员 布 局 等 "。 通 过 相关 理论 
研究 和 实践 探索 ， 学 者 提出 数据 监管 ， 即 为 确 
保 数据 当前 使 用 目的 ， 并 能 用 于 未 来 再 发 现 及 
再 利用 ， 从 数据 产生 开始 对 其 进行 管理 和 完善 
的 活动 下。 在 科学 数据 监管 体系 中 ， 科 学 交 
据 安 全 管理 是 其 中 的 关键 环节 。 数 据 安全 管理 
是 对 科学 数据 管理 中 存在 的 安全 问题 进行 管理 
的 过 程 站。 科学 数据 安全 管理 的 主要 管理 活 
动 包括 科学 数据 安全 管理 的 计划 、 安 全 隐患 识 
别 、 安 全 问题 的 定性 定量 评估 、 安 全 威胁 的 应 
对 措施 以 及 安全 威胁 控制 等 中。 学 者 通过 调研 
国内 外 的 科学 数据 安全 政策 发 现 ， 科 学 数据 安 
全 管理 具体 包括 数据 的 分 类 规则 、 数 据 共享 的 
限制 (对 数据 保密 级 别 、 共享 方 式 进 行 说 明 ) 、 数 
据 处 理 、 对 涉及 人 类 参与 者 隐私 安全 保护 等 几 
个 方面 。 在 技术 层面 ， 现 有 的 科学 数据 管 
理 平台 主要 采用 分 布 式 系统 架构 ， 也 有 学 者 提 
出 运用 区 块 链 技术 实现 交互 数据 描述 、 安 全 管 
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理 等 功能 中 。 总 体 来 说 ， 科 学 数据 安全 问题 已 
经 引起 全 社会 的 广泛 关注 ， 目 前 针对 科学 数据 
安全 管理 的 探讨 主要 集中 在 政策 和 技术 层面 。 
1.3 科学 数据 安全 行为 的 定义 

虽然 相关 政策 和 技术 都 在 逐步 完善 ， 但 是 
在 缺乏 行为 规范 的 环境 下 ， 仍 然 无 法 完全 保证 
科学 数据 的 安全 。 在 科学 数据 生命 周期 中 ， 科 
学 数据 在 共享 之 前 由 科研 人 员 直 接管 理 为 主 , 机 
构 或 科学 数据 管理 平台 协助 管理 为 辅 。 所 以 在 
这 个 过 程 中 科学 数据 的 安全 与 科研 人 员 的 行为 
密 不 可 分 。 信 息 安全 行为 的 相关 研究 证 明 ， 个 
体 行 为 是 造成 信息 安全 的 根本 因素 。 与 信息 有 
所 区 别 的 是 , 科学 数据 是 指 在 科技 活动 ( 实验 、 观 
察 、 探 测 、 调 查 等 ) 或 通过 其 他 方式 所 获取 的 
反映 客观 世界 的 本 质 、 特 征 、 变 化 规律 等 的 原 
始 基本 数据 ， 以 及 根据 不 同 科技 活动 需要 ， 进 
行 系统 加 工整 理 的 各 类 数据 集 。 在 形式 上 , P 
学 数据 在 整个 生命 周期 中 其 数据 形式 旦 动态 变 
化 的 状态 ; 在 时 效 性 上 ， 科 学 数据 具有 重复 利 
用 的 价值 ， 不 仅 是 数据 创建 者 形成 研究 成 果 的 
重要 数据 支撑 ， 同 时 还 可 以 为 后 续 的 研究 者 提 
HES; 在 内 容 上 ， 科 学 数据 安全 不 仅 包 含 数 
据 本 身 的 安全 , 还 包括 相关 利益 主体 的 安全 ™。 
鉴于 科学 数据 安全 管理 的 重要 性 和 复杂 性 以 及 
上 文 对 信息 安全 行为 和 科学 数据 安全 管理 的 介 
绍 ， 笔 者 把 科学 数据 安全 行为 定义 为 : 科研 工 
作者 在 从 事 科学 研究 的 过 程 中 ， 为 了 保证 科学 
数据 的 真实 性 、 合 法 性 、 有 效 性 、 机 密 性 、 完 
整 性 而 采取 的 相关 有 效 措施 的 行为 集合 。 由 于 
科学 研究 越 来 越 倾 向 于 以 团队 的 形式 开展 ， 科 
学 数据 安全 行为 不 仅 包 含 科研 人 员 的 个 人 行 
为 ， 还 包括 团队 行为 。 具 体 来 说 ， 科 学 数据 安 
全 行为 是 科研 人 员 在 开展 科研 活动 时 ， 在 已 有 
的 安全 知识 储备 基础 之 上 ， 主 动 采 取 有 利于 科 
学 数据 安全 、 规 避 潜 在 风险 的 行为 。 


@ 科 学 数据 安全 行为 研究 现状 


科学 数据 安全 行为 是 信息 安全 行为 的 重要 
DS, 通过 类 比 信息 安全 行为 的 研究 结论 ， 即 


认为 人 为 因素 是 导致 信息 安全 问题 的 根本 原因 。 
在 科学 数据 生命 周期 中 ， 科 学 数据 在 共享 发 布 
之 前 ， 主 要 由 其 拥有 者 进行 管理 ,在 此 期 间 ， 科 
学 数据 安全 主要 受到 个 体 行为 的 影响 。 因 此 ， 如 
何 规范 科研 人 员 的 科学 数据 安全 行为 ， 促 进 科 
学 数据 安全 政策 的 制定 ， 让 科研 人 员 在 科研 过 
程 中 对 科学 数据 的 安全 管理 有 章 可 循 ， 对 保证 
科学 数据 安全 ， 建 立 科 学 数据 安全 管理 体系 ,， 促 
进 科 学 数据 共享 具有 重要 意义 。 

国内 外 关于 科学 数据 安全 行为 的 探讨 ， 般 
和 在 对 数据 管理 员 (data librarian ) 的 角色 定 
位 问题 中 。 随 着 科研 模式 的 变革 ， 图 书馆 界 开 
始 探索 数据 管理 员 在 科学 数据 管理 过 程 中 应 该 
扮演 什么 样 的 角色 。 数 据 管理 员 的 职责 主要 围 
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学 数据 安全 管理 政策 落 到 实处 ， 则 需要 科研 人 
员 的 配合 。 

在 科学 数据 管理 与 共享 的 实践 中 也 会 涉及 
科学 数据 安全 管理 问题 ， 如 司 莉 等 在 研究 科学 
数据 管理 与 共享 的 需求 时 对 科研 人 员 科 学 数据 
管理 方式 、 保 存 方式 等 进行 了 分 析 ， 并 针对 科 
研 是 否 发 生 过 重要 科学 数据 丢失 /损毁 的 现象 
和 重要 科学 数据 丢失 / 损毁 的 原因 等 问题 进行 研 
究 ， 研 究 结 果 显 示 有 70% 的 科研 人 员 发 生 过 重 
要 科学 数据 丢失 /损毁 的 现象 ， 造 成 重要 科学 数 
WEEK /损毁 的 原因 主要 是 误 操作 或 误 删 除 握 。 
这 也 说 明科 研 人 员 的 科学 数据 安全 意识 还 有 待 
加 强 ， 规 范 科 研 人 员 行 为 以 保证 科学 数据 安全 
至 关 重 要 。 


绕 数 据 管理 问题 展开 ， 以 用 户 为 中 心 搜集 信息 


O 基于 科研 过 程 的 科学 数据 安全 行 
为 分 析 

目前 ， 集 科学 数据 管理 、 共 享 、 服 务 于 一 
体 的 科学 数据 管理 平台 主要 采用 生命 周期 模型 
对 科学 数据 进行 管理 5。 尹 春晓 在 调研 国外 高 
校 科 学 数据 管理 服务 之 后 总 结 出 ， 无 论 是 社会 


CD ”资源 ， 保 证 在 多 用 户 环境 下 信息 资源 的 安全 性 
= 和 可 访问 性 请。 国外 学 者 如 A. Cremer, R. H. 
© Khan, R. E. Martin 等 对 数据 馆 员 所 需要 的 职 \ 
了 素养 进行 了 归纳 ， 包 括 数据 的 保存 与 评估 、 数 
A 据 监管 、 开 发 元 数据 标准 、 数 据 分 析 与 服务 、 数 
O 。 据 安全 等 省 %。 国 内 主要 以 介绍 国外 数据 管理 
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的 创建 到 最 终 利 用 共享 ， 整 个 过 程 都 需要 科研 
人 员 的 参与 ， 其 中 保证 科学 数据 的 安全 是 进行 
数据 分 析 、 利 用 、 共 享 的 基础 。 虽然 相 关 研 究 
还 处 于 起 步 阶 段 ,但 以 数据 管理 员 的 职业 素养 
为 切入 点 探讨 科学 数据 管理 ， 为 科学 数据 安全 
行为 的 研究 提供 了 借鉴 。 

从 国外 高 校 ( 如 哈佛 大 学 中、 普林斯顿 大 
学 个、 斯 坦 福 大 学 等 ) 制定 的 科学 数据 管理 
政策 可 以 看 出 ， 科 学 数据 安全 问题 已 经 引起 广泛 
关注 。 虽 然 不 同学 校对 科学 数据 安全 管理 的 规定 
有 所 差异 ， 但 主要 集中 在 以 下 3 个 方面 : 中 要 求 
研究 人 员 遵 守 相 关 协 议 中 的 规定 ; 包 要 求 研 究 
人 员 使 用 最 佳 的 存储 设备 和 技术 ， 在 不 给 研究 
人 员 带 来 过 多 负担 的 情况 下 安全 地 保护 科学 数 
据 ; 久保 护 研 究 对 象 免 受 意外 披露 或 不 当 使 用 
机 密 数 据 可 能 造成 的 伤害 。 这 些 政策 从 宏观 上 
KI 了 科学 数据 安全 管理 的 方向 ， 但 为 了 让 科 


科学 还 是 自然 科学 ， 其 数据 管理 生命 周期 都 可 
归纳 为 以 下 几 个 阶段 : 制定 数据 管理 计划 、 数 
据 收集 与 选择 、 数 据 描述 与 组 织 、 数 据 分 析 与 
利用 、 数 据 保存 与 发 布 、 数 据 发 现 与 获取 1。 
可 以 看 出 ， 在 科学 数据 生命 周期 的 不 同 阶 段 科 
研 人 员 的 主要 工作 内 容 存 在 差异 ， 这 与 科研 过 
程 具有 阶段 性 息息相关 。 杨 传 汶 等 通过 访谈 总 
结 了 科研 过 程 包括 以 下 7 个 步骤 : 制定 计划 、 进 
行 试 验 、 收 集 数据 、 解 释 与 分 析 、 得 出 结论 、 表 
达 与 交流 、 评 价 与 改进 中 。 鉴 于 在 科研 活动 
中 ,科研 人 员 作 为 主要 行为 主体 ， 其 科研 过 程 
的 阶段 性 与 科学 数据 生命 周期 的 划分 具有 紧密 
联系 。 笔 者 结合 科学 数据 管理 政策 及 相关 科学 
数据 管理 模型 总 结 了 科研 过 程 的 一 般 过 程 。 如 
图 1 所 示 。 

根据 图 1 可 以 看 出 ， 科 学 研究 的 一 般 过 程 
并 不 像 科 学 数据 生命 周期 模型 旦 线性， 其中, 数 
据 存储 、 数 据 分 析 、 数 据 描述 处 于 并 行 状 态 。 
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科学 数据 在 科研 过 程 中 一 直 处 于 动态 变换 的 状 
态 ， 这 种 动态 变换 让 科学 数据 实现 了 从 数据 到 
知识 的 跃迁 ， 即 原始 的 科学 数据 属于 数据 ， 处 
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由 于 在 科研 过 程 中 ， 科 研 人 员 的 行为 对 科 
学 数据 安全 产生 直接 影响 ， 笔 者 将 从 制定 数据 
管理 计划 、 数 据 生成 与 采集 、 数 据 存 储 、 数 据 
描述 、 数 据 分 析 、 数 据 利 用 与 汇 交 几 个 阶段 进 
行 详细 阐述 ,分析 在 不 同 阶 段 可 能 存在 的 安全 
风险 ， 以 明确 从 个 人 行为 角度 进行 科学 数据 管 
理 的 重点 ， 并 提出 如 何 从 行为 学 视角 出 发 加 以 
防范 。 
3.1 制定 数据 管理 计划 

2011 年 ， 美 国 国家 科学 基金 会 (NSF ) 要 
求 所 有 基金 申请 者 必须 提交 对 所 申请 的 项 目 开 
展 的 数据 管理 计划 (data management plans, D- 
MP) 。 随 后 相关 科学 数据 管理 政策 也 对 此 做 
了 明确 的 要 求 ， 制 定 科学 数据 管理 计划 已 经 成 
了 开展 科研 活动 必 不 可 少 的 工作 。 科 学 数据 管 
理 计 划 是 科研 人 员 用 来 描述 研究 项 目 中 期 待 获 
取 或 生成 的 数据 , 对 这 些 数 据 如 何 管理 、 撒 述 、 分 
析 、 存 储 ， 项 目 结束 后 采用 什么 机 制 来 共享 和 
保存 数据 的 书面 文件 中 。 完 备 的 数据 管理 计划 
是 科研 人 员 获 取 科研 资助 单位 支持 的 前 提 ， 也 
是 其 有 效 管 理科 研 项 目 所 生产 科学 数据 ， 规 避 
或 应 对 可 能 产生 的 各 类 问题 的 重要 保障 上 。 也 
就 是 说 ， 科 学 数据 管理 计划 有 利于 科研 人 员 对 
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于 分 析 过 程 中 的 科学 数据 属于 信息 ， 作 为 结果 
的 科学 数据 经 过 科研 人 员 的 解释 和 说 明 具 有 知 
识 的 属性 。 


科研 项 目 启动 


数据 存储 


数据 生成 与 采集 | 


数据 描述 


图 1 科学 研究 的 一 般 过 程 


所 从 事 的 科研 项 目 有 全 局 意识 ， 使 其 更 有 可 能 
规避 科研 过 程 中 产生 的 各 类 问题 。 爱 丁 堡 大 学 
科学 数据 管理 政策 规定 : 科学 数据 管理 计划 要 
明确 数据 采集 、 管 理 、 完 整 性 、 机 密 性 、 保 留 、 共 
享 和 发 布 等 内 容 中。 目前 ， 科 研 资助 机 构 主 要 
通过 两 种 方式 对 科学 数据 管理 计划 的 撰写 提供 
指导 : 外 提供 政策 指导 ， 如 斯 坦 福 大 学 提出 的 
数据 管理 计划 指南 钻 ; @@ 提 供 技术 服务 ， 如 
英国 数据 监管 中 心 (DCC ) 提供 了 支持 标准 化 
的 工具 DMPOnline5 7 ， 美 国 加 州 福 尼 亚 数 字 图 
书馆 提供 支持 和 服务 的 数据 管理 计划 制定 工具 
DMPTool5。 笔 者 通过 调研 国内 外 相关 科学 数 
据 管理 计划 的 政策 文献 中， 归纳 了 科学 数据 
管理 计划 包含 的 主要 内 容 : 中 对 科研 项 目 进行 
描述 ，@ 数 据 的 组 织 和 存储 ; @ 数 据 的 获取 、 分 
享 和 重用 说 明 ; 外 数据 存档 说 明 。 其 每 个 部 分 
包含 的 具体 内 容 如 表 1 所 示 。 
3.2 科学 数据 生成 与 采集 

科学 数据 生成 与 采集 过 程 是 建立 在 系统 的 
数据 收集 方法 之 上 ， 针 对 设计 的 研究 变量 收集 
数据 ， 为 证 明 研 究 问题 、 验 证 假设 和 评估 结 
服务 。 虽 然 数据 收集 方法 因 学 科 差异 而 有 所 不 
同 ， 但 对 数据 质量 都 同样 重视 。 由 科学 数据 安 
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全 行为 的 定义 可 知 , 保证 科学 数据 的 真实 性 、 合 
法 性 是 数据 收集 过 程 中 的 核心 问题 。 收 集 不 合 
适 的 数据 可 能 带 来 以 下 影响 : 无 法 准确 回答 研 
究 问 题 ; 无 法 进行 重复 验证 ; 造成 资源 浪费 ; 对 
其 他 研究 人 员 形 成 误导 ; 对 人 类 研究 者 或 动物 
主体 造成 伤害 。 除 此 之 外 ， 如 果 将 由 这 种 不 合 
适 的 数据 用 于 建立 公共 政策 的 数据 支撑 ， 则 可 
能 造成 严重 的 不 良 影响 。 为 了 保证 数据 的 真实 
性 、 合 法 性 和 完整 性 ，G. L. Knatterud 提出 可 
以 从 质量 保障 (quality assurance ) 和 质量 控制 
(quality control ) PA Dy Ii] A, M E PRUE 
是 指 在 数据 收集 之 前 进行 的 活动 ， 可 以 通过 以 
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下 方法 对 科学 数据 的 收集 提供 保障 : 中 编写 数 
据 收集 程序 手册 ; @@ 提 前 了 解 收集 数据 需要 了 
解 的 领域 知识 ; OFERI A H BR Alon 
HE; @ 学 习 数 据 收集 工具 的 使 用 方法 。 质 量 控 
制 是 指 在 数据 收集 期 间 和 数据 收集 之 后 进行 的 
活动 ， 在 这 个 过 程 中 ,需要 数据 收集 者 明确 其 
职责 ， 严 格 按照 数据 收集 步骤 进行 ， 并 建立 反 
伺机 制 对 其 进行 评 佑 ， 发 现存 在 的 问题 后 ， 及 
时 进行 修正 调整 。 针 对 质 性 研究 ， 为 了 验证 数 
据 质量 ， 可 以 采用 三 角 互 证 的 研究 方法 外， 利 
用 社会 期 望 量 表 来 减 小 应 答 偏差 对 实验 数据 效 
度 的 影响 四。 


表 1 数据 管理 计划 应 包含 的 内 容 
描述 项 目 内 容 
科研 项 目 研究 目的 ; 数据 的 来 源 ; 如 何 获取 数据 ; 数据 的 类 型 ; 数据 管理 的 权 责 划分 
数据 的 组 织 和 元 数据 的 创建 、 管 理 、 存 储 说 明 ; 文件 命名 规则 说 明 ; 本 地 存储 和 备份 过 程 说 明 ; 数据 读 取 说 
存储 明 (查看 数据 需要 用 到 什么 工具 和 软件 ) 
数据 的 获取 、 谁 有 权 访 问 这 些 数据 ; 可 以 通过 哪些 途径 获取 ; 数据 共享 说 明 (是否 涉 及 隐私 、 道 德 或 保密 问 
分 享 和 重用 W); 这 项 研究 的 知识 产权 说 明 ; 是 否 允 许 数据 重用 ; 数据 的 授权 ( 是 否 允 许 商业 用 途 ) 
数据 存档 数据 长 期 保存 说 明 ( 是 否 会 存储 在 数据 存储 中 心 ， 如 果 不 是 ， 将 如 何 存储 数据 ) ; 数据 的 保存 
E 时 间 


3.3 存储 数据 

科学 数据 的 存储 与 维护 是 实现 科学 数据 共 
享 利 用 、 发 挥 其 最 大 价值 的 重要 基础 “0。 存 
储 数据 之 所 以 重要 ， 是 因为 许多 科学 数据 是 独 
一 无 二 的 ,一旦 被 毁坏 将 可 能 永远 丢失 "9。 
在 我 国 ， 由 于 项 目 资 助 机 构 对 科学 数据 提交 没 
有 强制 要 求 ， 导 致 大 部 分 数据 分 散在 课题 组 或 
个 人 手中 ， 使 科学 数据 面临 损坏 或 永远 丢失 的 
危险 中。 对 于 数据 的 存储 ， 笔 者 通过 调研 国内 
外 科学 数据 保存 政策 ， 总 结 出 科学 数据 存储 时 
应 该 考虑 以 下 几 个 方面 : 

C1) 数据 的 命名 规则 。 文 件 名 是 文件 的 主 
体 标识 符 ， 规范 的 文件 名 可 以 为 文件 的 内 容 、 状 
态 和 版 本 提供 有 用 的 提示 ， 有 助 于 对 文献 进行 分 
类 和 排序 。 南 安 普 顿 大 学 和 英国 数据 服务 中 心 制 
定 了 数据 文件 命名 规则 可 供 参 考 OO GT 文件 名 
应 该 做 到 简洁 且 意 义 明确 ; @ 整 个 科研 项 目的 
文件 应 该 按照 同一 个 命名 规则 ， 保 证 文件 的 一 致 


PE; Qik ERATE S (U1 & 2! ) Ok 
免 文 件 名 过 长 ; 加 借助 连 字 符 “-” 或 下 划 线 
”>” 分 隔 文件 名 中 的 元 素 ， 使 其 具有 更 好 的 
可 读 性 ; @ 为 针对 特定 应 用 程序 的 代码 文件 保 
留 文件 扩展 名 〈 如 doc, xls, tif) ; OE 
件 名 中 包含 文件 的 版 本 控制 。 

(2) 数据 的 存储 位 置 。 选 择 合适 的 存储 
位 置 对 科学 数据 管理 和 利用 带 来 很 大 的 便利 。 
通常 可 以 用 来 存储 科学 数据 的 有 以 下 5 类 "1; 
QD 机 构 存 储 ， 一 般 指 学 校 或 科研 机 构 的 数据 存 
储 中 心 ; @ 本 地 存储 , 如 个 人 电脑 ; Oa Fete, 如 
DropBox „Google Drive 等 ; @ 便 携 式 存储 设备 ,如 
USB 存储 器 、DVD 等 ; @ 纸 质 存储 。 每 一 种 存 
储 方式 都 有 优 缺 点 ， 科 研 人 员 在 选择 存储 时 ， 还 
应 该 参照 项 目 中 产生 科学 数据 的 大 小 、 数 据 的 
保密 级 别 、 访 问 需求 (是 否 提供 远程 访问 ) 等 
因素 选择 合适 的 存储 方式 选择 合适 的 数据 存储 
位 置 。 


EE 
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(3 ) 数据 文件 存储 的 格式 。 恰 当 的 文件 存 
储 格 式 可 以 避免 数据 失效 并 便于 数据 重用 六 1。 
在 选择 文件 格式 时 ， 必 须 考虑 ， 数据 的 分 析 方 
法 、 相 关 标 准 、 软 件 和 硬件 的 兼容 性 、 是 专属 
软件 还 是 开源 软件 等 问题 中。 在 数据 收集 和 分 
析 过 程 中 ,研究 人 员 可 能 会 选择 比较 方便 的 通 
用 格式 ， 但 为 了 使 数据 能 长 期 存储 ， 便 于 未 来 
进行 数据 访问 ， 建 议 将 数据 存储 为 开放 格式 。 
斯 坦 福 大 学 图 书馆 建议 的 数据 存储 格式 " 如 表 
2 所 示 。 

(4) 备份 策略 。 备 份 数据 可 以 确保 原始 文 
件 因 一 些 意外 原因 ( 如 硬件 故障 、 计 算 机 病毒 
感染 等 ) 而 丢失 时 ， 可 以 从 备份 的 副本 中 恢复 
原始 数据 文件 ， 从 而 减少 损失 。 选 择 备份 策略 
时 要 考虑 本 地 存储 情况 、 数 据 的 价值 以 及 环境 
的 风险 级 别 。 英 国 数据 服务 中 心 提出 的 在 制定 
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数据 备份 策略 时 应 该 考虑 的 问题 及 建议 "如 表 
3 所 示 。 


表 2 科学 数据 存储 格式 


文件 类 型 建议 的 存储 格式 
文本 文件 ve PDF/A, HTML, ASCII, 
音频 文件 WAVA, AIFF, MP3, MXF 
压缩 文件 TAR, GZIP, ZIP 
数据 库 文 件 XML 、CSV 
地 理 空间 数据 SHP, DBF, GeoTIFF, NetCDF 
运动 图 像 MOV. MPEG, AVI, MXF 
统计 数据 ASCII, DTA, POR, SAS, SAV 
静态 图 像 eh a PDF PNG, 
表格 数据 CSV 
网 页 WARC 


表 3 制定 数据 备份 策略 


备份 项 目 具体 内 容 
备份 的 内 容 根据 机 构 是 否 可 以 恢复 系统 的 具体 情况 ， 考 虑 是 备份 特定 的 数据 还 是 备份 整个 系统 。 


如 果 可 以 恢复 系统 ， 则 只 需要 备份 数据 文件 即 可 


是 否 包含 做 感 信息 如 果 数 据 文 件 涉及 个 人 敏感 信息 ， 应 该 只 创建 所 需 的 最 少 的 备份 副本 ， 并 对 数据 进行 
[ei NTH 力 


12 
备份 的 频次 人 或 定期 备份 ， 或 者 借助 工具 对 关键 数据 文件 进行 自 
i 动 备 份 


可 实现 自动 备份 的 工具 ”微软 的 synctoy、 苹 果 Mac 的 Time Machine 等 


备份 存储 介质 的 选择 yon 
备份 数据 的 保存 格式 。 采用 适合 长 


少量 的 数据 文件 可 以 使 用 CD/DVD 等 ， 如 果 是 大 量 的 数据 文件 ， 则 建议 使 用 移动 硬盘 


期 保存 的 文件 格式 ， 可 参照 表 2 


增 量 备份 是 指 备份 自 上 一 次 备份 之 后 有 变化 的 数据 ， 建 议 使 用 可 移动 设备 进行 备份 。 
增 量 备份 还 是 差异 备份 ”差异 备份 是 指 备份 上 一 次 完全 备份 之 后 有 差异 的 数据 ， 建 议 使 用 固定 介质 〈 如 硬盘 驱 


Shar) 进行 备份 


如 何 组 织 备 份 数据 
备份 数据 的 存储 位 置 


性 


(5) 数据 存储 的 安全 性 。 科 学 数据 的 安 
全 不 仪 包括 科学 数据 本 身 的 安全 ， 还 包括 相关 
利益 主体 的 安全 。 为 了 确保 数据 本 身 的 存储 安 
全 性 ， 可 以 采取 以 下 措施 : 中 控制 访问 权限 。 
可 以 通过 对 数据 进行 加 密 来 控制 访问 权限 。 除 
了 对 数据 进行 加 密 之 外 ， 同 时 还 要 对 存储 有 科 


通过 建立 标签 体系 ， 定 期 验证 备份 的 文件 ， 通 过 与 原始 文件 进行 比较 ， 检 查 其 完整 


一 般 数 据 可 以 存储 在 网 络 云 盘 上 ， 对 于 涉及 个 人 信息 的 数据 建议 脱 机 存储 


学 数据 的 存储 设备 ( 如 笔记 本 电脑 、 台 式 机 和 
移动 设备 ) 进行 加 密 ， 降 低 未 经 授权 的 访问 导 
BFE A ELE BAR WY BLS BE AY UE, OX 
数据 进行 分 级 。 对 于 涉及 人 类 参与 者 的 科学 数 
据 ， 可 以 通过 对 数据 进行 分 级 。 哈 佛 大 学 科学 
数据 管理 中 心 9 提出 将 科学 数据 分 成 5 个 等 
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级 ， 并 对 不 同 级 别 的 数据 提出 了 存储 方案 , 如” 表 4 所 示 : 


表 4 哈佛 大 学 的 数据 分 级 制度 


级 别 


描述 


Level5: 极其 敏感 的 数据 
Level4: 非常 敏感 的 数据 
Level3 : 敏感 或 机 密 额 数据 
Level2: 保密 的 良性 数据 


Levell: 非 保密 的 数据 


3.4 数据 描述 


如 果 汇 露 会 对 个 人 或 学 校 造成 严重 伤害 的 数据 ， 如 可 识别 个 人 身份 的 医疗 信息 、 
遗传 信息 


此 露 可 能 会 对 个 人 或 学 校 造 成 严重 伤害 的 数据 ， 如 可 识别 的 财务 信息 、 国 家 


如 果 ; 


安全 信息 、 可 获取 机 密 信 息 的 密码 


如 果 ; 


此 露 可 能 会 对 个 人 或 学 校 造 成 重大 风险 的 数据 ， 包 括 机 构 人 事 记 录 ， 财 务 记 


录 ， 个 人 捐助 信息 ， 除 第 四 、 五 等 级 之 外 受 法 律 保 护 的 个 人 信息 

泄露 不 会 造成 重大 损害 ， 学 校 还 是 会 选择 保密 的 数据 ， 包 括 示 发 表 的 科研 成 果 以 
及 第 三 、 四 等 级 之 外 的 知识 产权 、 论 文 初稿 、 专 利 申请 文件 

公共 信息 ,包括 没有 身份 标识 的 科研 数据 、 已 发 表 的 研究 数据 、 学 校 公开 信息 等 


述 是 指 利用 标准 化 、 规 范 化 的 术语 对 数据 进行 描 


司 莉 通过 实证 研究 发 现 ， 有 50% 以 上 的 科研 。” 述 "。 通 常 使 用 元 数据 对 科学 数据 进行 描述 。M. 
人 员 表 示 科 学 数据 管理 中 的 问题 有 不 知道 如 何 为 ” ”Wilkinson 等 从 4 个 维度 提出 了 科学 数据 元 数据 的 
数据 创建 索引 以 及 不 记得 数据 的 存储 位 置 "。 对 。 ”准则 ， 即 易 发 现 、 易 获取 、 可 操作 、 可 重用 ™。 
科学 数据 进行 描述 可 以 使 科研 人 员 更 容易 对 数据 ”从 具体 应 用 层面 来 看 ， 国 外 一 些 机 构 和 大 学 图 书 
进行 定位 ， 方 便 对 数据 的 理解 和 重用 。 数 据 描 。 ”人 馆 制定 了 元 数据 的 标准 中 ， 如 表 5 所 示 : 


描述 项 


表 5 数据 描述 的 基本 要 素 
描述 


题名 ”数据 集 或 科研 项 目的 名 字 

作者 ”创建 数据 的 机 构 或 研究 人 员 的 名 字 
标识 符 ”用 于 标识 数据 的 编号 

主题 ”描述 数据 的 关键 词 或 短语 
资助 者 ”资助 研究 项 目的 组 织 或 机 构 


权限 “其 他 研究 者 如 何 获取 数据 的 说 明 
语言 ”研究 成 果 所 包含 数据 资源 的 语言 


日 期 ” 与 数据 有 关 的 关键 信息 ， 包 括 项 目 开 始 日 期 、 结 束 日 期 、 发 布 日 期 、 所 经 历 的 时 间 周 期 。 其 他 的 
日 期 如 数据 更 新 日 期 、 维 护 周 期 等 


地 址 ” 记录 与 数据 有 关 的 物理 空间 信息 


方法 ”数据 的 收集 方法 ， 包 括 所 使 用 的 设备 和 软件 、 实 验 协 议 等 
数据 处 理 ” 关 于 数据 处 理 的 过 程 和 步 又 


资源 引用 的 其 它 数据 资源 ， 记 录 其 数据 来 源 和 获取 方法 


文件 列表 ”与 该 科研 项 目 有 关 的 所 有 数据 文件 名 单 
文件 格式 ”对 数据 格式 的 说 明 
文件 结构 ”数据 文件 的 层级 
变量 列表 ”数据 文件 中 所 涉及 的 所 有 变量 列表 

代码 清单 ”对 文件 名 或 数据 文件 中 的 变量 使 用 的 代码 或 缩写 的 解释 


版 本 


H 


个 文件 发 布 的 时 间 


校 验 ”参照 备份 的 文件 ， 测 试 文件 是 否 随 着 时 间 的 推移 而 更 改 
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针对 不 同 的 学 科 ， 也 有 相应 的 元 数据 标 
准 823) 如 表 6 所 示 : 


表 6 不 同学 科 的 元 数据 标准 
学 科 元 数据 标准 


ARE 社会 科学 标准 (DDI) 

地 理 空间 ”数字 地 理 元 数据 内 容 标准 ( CSDGM ) 
数据 地 理 信息 国际 标准 (ISO19115:2003 ) 
人 文 数据 ”都 柏林 核心 集 (DC) 

P P 数字 图 像 的 元 数据 标准 (NISO 

多 媒体 数据 Z39.87-2002 ) 

天 文 数据 “天文 可 视 化 元 数据 标准 (AVM ) 


3.5 数据 分 析 

数据 分 析 是 科研 人 员 利 用 科学 的 数据 分 
析 方 法 把 原始 的 科学 数据 转化 为 科研 成 果 的 阶 
段 ,是 科研 人 员 对 科学 数据 操作 最 频繁 的 阶段 ,最 
容易 出 现 的 科学 数据 安全 风险 包括 误 操 作 或 误 删 
除 、 存 储 设备 故障 等 。 由 图 1 可 以 看 出 ， 在 科研 
活动 中 ， 数 据 存储 、 数 据 分 析 、 数 据 组 织 三 者 是 
相互 交织 的 过 程 ， 具 体 来 说 数据 存储 和 数据 组 织 
是 为 了 数据 分 析 做 准备 ， 数 据 分 析 和 数据 组 织 
后 必须 要 对 数据 进行 存储 ， 数 据 组 织 是 为 了 更 好 
地 进行 数据 存储 和 数据 分 析 。 在 进行 数据 分 析 
时 ， 科 学 数据 的 形式 处 于 动态 变化 的 状态 ， 为 了 
保证 数据 分 析 的 顺利 进行 ， 应 该 根据 数据 描述 和 
数据 存储 规则 对 数据 进行 描述 和 存储 。 
3.6 数据 利用 与 汇 交 

关于 科学 数据 共享 的 实证 研究 数据 显 
示 ，42.82% 的 科研 人 员 表 示 在 科研 项 目 结 
后 ， 科 学 数据 分 散在 项 目 组 成 员 手 中 多。 这 表 
明 一 部 分 科学 数据 并 没有 被 利用 起 来 ， 科 研 人 员 
汇 交 科学 数据 的 积极 性 还 有 待 提高 。 对 科学 数据 
进行 汇 交 是 科学 数据 从 个 人 管理 层面 进入 数据 流 
通 系统 的 重要 环节 ， 按 照相 关 标 准 对 科学 数据 进 
行 整 理 ， 提 交 到 数据 共享 中 心 。 数 据 汇 交 是 科研 
人 员 对 自己 在 科研 过 程 中 产生 的 科学 数据 的 集中 
整理 ， 确 保科 学 数据 的 有 效 性 和 完整 性 。 根 据 
《科学 数据 管理 办 法 》 的 第 十 三 条 规定 ， 由 政府 
预算 资金 资助 的 各 级 科技 计划 项 目 所 形成 的 科学 
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数据 ， 应 由 项 目 牵 头 单位 汇 交 到 相关 科学 数据 中 
心思 。 从 科研 人 员 的 角度 来 看 ， 要 考虑 的 问题 是 
把 数据 交 到 什么 地 方 去 ”以 及 交 什 么 ?如 何 交 ? 
针对 这 一 系列 问题 ， 国 外 科研 项 目 管理 机 构 、 学 
术 期 刊 及 数据 机 构 制 定 了 科学 数据 汇 交 政策 。 
我 国 于 2008 年 3 月 首次 由 科技 部 颁布 了 《国家 
重点 基础 研究 发 展 计划 资源 环境 领域 项 目 数据 汇 
交 和 暂行 办 法 》"“ i。 要求 把 科学 数据 汇 交 到 相应 的 
数据 汇 交 中 心 。 鉴 于 科学 数据 的 复杂 性 ， 不 同学 
科 领 域 建立 了 科学 数据 汇 交 管理 办 法 ， 部 分 领域 
的 科学 数据 汇 交 管理 办 法 见 表 4， 同 时 ， 部 分 领 
域 如 气象 、 测 绘 、 水 文 的 数据 共享 管 理 办 法 也 包 
含 数据 汇 交 细则 。 这 些 管 理 办 法 对 数据 汇 交 的 组 
织 管理 、 汇 交 内 容 、 数 据 汇 交 计划 、 数 据 汇 交流 
程 、 数 据 管理 、 权 益 保 护 、 监 督 与 信用 管理 等 都 
做 了 规定 。 数 据 汇 交 的 内 容 包括 科研 项 目 生 成 或 
采集 的 原始 数据 以 及 对 原始 数据 进行 处 理 和 加 工 
后 形成 的 数据 。 为 了 保证 科学 数据 汇 交 工作 的 顺 
利 进行 ， 科 学 数据 管理 中 心 引 入 流程 管理 思想 来 
规范 数据 汇 交 与 管理 中。 及 时 汇 交 和 共享 科学 数 
据 资 源 ， 既 是 国家 科技 投入 的 直接 效益 体现 ， 也 
是 促进 这 些 数据 更 好 地 被 归档 、 存 储 、 共 享 和 开 
发 利用 的 重要 途径 " …。 所 以 科研 人 员 在 科研 项 目 
结束 后 , 应 该 充分 了 解 相关 数据 汇 交 管理 办 法 ,并 
以 此 为 基础 对 科学 数据 进行 整理 和 筛选 ， 形 成 统 
一 规范 的 数据 格式 , 及 时 地 提交 到 数据 共享 中 心 。 


表 7 部 分 科学 数据 共享 中 心 及 其 数据 汇 交 管理 办 法 
科学 数据 共享 中 心 ”科学 数据 汇 交 管理 办 法 
国家 人 口 与 健康 科 《中 医药 科研 襄 题 数据 汇 交 区 
学 数据 共享 中 心 。 理 办 法 》 M 
国家 农业 科学 数据 《农业 科学 数据 汇 交管 理 办 
其 训 中 心 法 )》 mm 
地 震 科学 数据 共 。 《人 工地 震 科学 数据 汇 交 与 共 
享 中 必 享 管理 办 法 (试行)》 外 
aes 。 《国家 重点 基础 研究 发 展 计划 
FETE SUE SS 资源 环境 领域 项 目 数据 汇 交 斩 
fi 行 办 法 》 


六 次 汉 和 所 hp、《 中 国 科学 院 南 海 海洋 研究 所 
南海 海 至 数据 中 心 妆 扬 汇 交管 理 辕 行 办 法 》m" 
国家 材料 科学 数据 《材料 科学 数据 提交 格式 规 
共享 中 心 范 》 四 
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科学 数据 安全 不 仅 涉及 科学 数据 本 身 的 安 
全 , 也 包括 相关 利益 主体 (个 人 、 组 织 、 国 家 ) 的 
安全 。 在 科学 数据 开放 共享 的 时 代 ， 科 学 数据 
安全 管理 是 实现 科学 数据 共享 的 基础 。 虽 然 相 
关 政 策 对 科学 数据 管理 平台 、 组 织 机 构 ( 如 个 
高 校 图 书馆 、 科 研 资 助 机 构 ) 以 及 科研 工作 者 
划 定 了 他 们 的 职责 和 义务 。 但 总 体 而 言 ， 国 家 
法 律 的 条 例 是 概括 性 的 、 原 则 性 的 。 如 何 将 其 
分 别 具 体 细 化 到 各 类 行为 主体 并 实施 于 科学 妆 
据 安 全 管理 实践 ， 则 或 需 科 学 数据 安全 行为 的 
及 时 跟 进 。 根 据 科 学 研究 的 一 般 过 程 ， 科 学 数 
据 在 共享 之 前 ， 其 安全 主要 受到 科研 人 员 行 为 
的 影响 ,所 以 笔者 探讨 的 科学 数据 安全 行为 主 
要 针对 科研 人 员 。 根 据 上 述 分 析 ， 为 保障 科学 
数据 安全 ， 在 科研 过 程 的 不 同 阶段 ， 由 于 科研 
工作 者 的 工作 内 容 的 差异 导致 其 所 采取 的 措施 
也 不 同 。 在 制定 科学 数据 管理 计划 阶段 ， 需 要 
研究 者 对 科研 项 目 所 产生 的 数据 有 大 致 了 解 , 并 
对 如 何 管理 科学 数据 做 出 规划 ， 才 能 在 后 续 阶 
段 对 科学 数据 安全 管理 有 一 个 宏观 的 把 控 ; 在 
数据 收集 与 采集 阶段 ， 为 保障 科学 数据 质量 , 研 
究 者 需要 在 数据 收集 前 做 相应 的 准备 工作 ， 在 
数据 收集 过 程 中 采取 相关 措施 对 数据 质量 进行 
控制 ; 在 数据 存储 阶段 ， 可 以 从 数据 的 命名 规 
则 、 存 储 位 置 、 数 据 文件 存储 格式 、 数 据 备份 
策略 等 几 个 方面 保障 科学 数据 安全 ; 在 数据 组 
织 阶段 ， 可 以 参照 相关 学 科 元 数据 标准 对 数据 
进行 描述 ; 在 数据 分 析 阶 段 ， 则 应 该 选择 科学 
的 数据 分 析 方 法 对 数据 进行 分 析 ， 同 时 参照 数 
据 存储 和 数据 组 织 的 相关 准则 对 数据 进行 操 
作 ; 在 数据 利用 与 汇 交 阶段 ,需要 对 数据 进行 
整理 筛选 ， 按 照相 关 科学 数据 汇 交 管理 办 法 汇 
交 到 科学 数据 管理 中 心 , 实现 科学 数据 的 共享 。 

科学 数据 安全 行为 是 科研 人 员 在 科研 活动 
中 为 保证 科学 数据 及 相关 利益 主体 安全 而 采取 
的 主动 防御 措施 ， 是 基于 个 人 行为 从 微观 层面 
对 科学 数据 提供 的 保障 。 规 范 科研 人 员 的 安全 
行为 是 构建 科学 数据 安全 体系 必 不 可 少 的 步骤 。 
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笔者 根据 现实 需求 ， 整 合 信息 安全 行为 、 科 学 
数据 安全 管理 的 相关 理论 和 政策 ， 基 于 科研 过 
程 不 同 阶 段 的 工作 内 容 的 差异 分 析 了 可 能 存在 
的 安全 风险 及 应 该 如 何 加 以 防范 ， 以 期 为 科研 
人 员 在 科研 过 程 中 实现 对 科学 数据 安全 管理 提 
供 指导 和 建议 ， 同 时 为 科研 管理 机 构 制定 科学 
数据 安全 管理 计划 提供 参考 。 本 文 不 足 之 处 在 
于 ， 现 阶段 关于 科学 数据 安全 的 研究 成 果 主 要 
针对 科学 数据 管理 中 心 ， 这 些 政策 及 建议 对 科 
学 数据 安全 行为 的 适用 性 还 有 待 实证 检验 ， 这 
也 是 下 一 步 需 要 继续 研究 的 方向 。 
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Abstract: [Purpose/significance] This paper defines the concept of scientific data security behavior, and 
combines different stages of research activities to analyze how to ensure the safety of scientific data in the 
scientific research process. It is of great significance to standardize the scientific data security behavior of 
scientific researchers, promote scientific data security management, formulate scientific data security poli- 
cies, and improve the scientific data security management system. [Method/process] The network research 
method was adopted to integrate the definition of information security behavior and scientific data security 
management, and then, the concept of scientific data security behavior was proposed. On this basis, starting 
from the theory, this paper combined with the practical experience of scientific data management and sharing 
to explained that way to ensure the security of scientific data through personal behavior. [Result/conclusion] 
At this stage, scientific data security management is aimed at scientific data management platform. Research 
on scientific data security from the perspective of behavior is still in its infancy. Based on the scientific re- 
search process, this paper analyzes how to standardize the behavior of scientific researchers to improve the 
security of scientific data from two aspects. First, in the stage which existence of scientific data security risk, 
combined with the policy of scientific data management, this paper proposes a targeted improvement strategy. 
Second, for the stage where there is no obvious security risk, suggestions are put forward which based on the 
practical experience of scientific data management at home and abroad. 
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